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L’ANALYSE FACTORIELLE DES COR RES PON DANCES 
ET L’ARBRE DE LONGUEUR MINIMUM; 
EXEMPLES ^APPLICATION 


par J.-P. Briane, J.-J. Lazare, G. Roux et C. Sastre 1 


Summary: Two numerical methods have been applied in examples of phytosocio- 
logical and taxonomic studies. Those are the correspondance factor analysis and the 
minimum spanning tree used complementarily. The first method uses the metric of 
/- whose interest lies in the simultaneous representation of objects and variables in 
the same diagram. The second is a classification method whose result is a tree which 
summarizes the relations between objects. 

The relationships between the genus Sauvagesia (Ochnacete) and Other genera 
closely related taxonomically is given as an example of application in taxonomy. 

In the phytosociology exemple, both methods are applied in the study of Festucetum 
halleri in Southern Alps. Problems of duplication of the units are discussed. 


Bien que different par leurs objectifs, phytosociologie et taxonomie 
sont non settlement scientifiquement complementaires mais aussi tres compa¬ 
rables par les methodes utilisees. En particulier, toutes deux doivent affron¬ 
ter le mcme probleme : la classification d’objets (relcvcs du phytosociologue, 
taxa du taxonomiste) en fonction de variables (listes floristiques du phyto¬ 
sociologue, caracteres du taxonomiste). 

Depuis longtemps, des techniques numeriques simples (metroglyphes, 
analyses de Czekanowski, dendrogrammes, etc.) ont 6te utilisees par les 
phytosociologues et les taxonomistes. Ces methodes sont parfois imprecises, 
voire entachees d’arbitraire. 

L’emploi d’ordinateurs puissants permet aujourd’hui d’envisager l’utili- 
sation de methodes plus efficaces telles que Fanalyse multivariable et les 
algorithmes de classification automatique. 

En outre, l’augmentation des performances des ordinateurs permet 
de traiter des donnees de plus en plus nombreuses. 

Deux des methodes essayees nous ont donne particulierement satis- 
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faction : ('analyse factorielle des correspondances (B. Cordier, 1965) 
utilisee conjointement avec 1’arbre de longueur minimum (J.-G. Gower 
ct G.-J.-S. Ross, 1969). Nous allons decrire ces deux techniques et en donncr 
des applications. 

Les recherches ont ete effectuees au Laboratoire de Taxonomie vigetale 
experimentale et numerique 1 (Universite Paris-Xl) en collaboration avec 
le Laboratoire de Statistique Mathematique (Universite Paris-VIl). L’ordi- 
nateur utilise est 1’UNIVAC 1108 du Centre de calcul de l’Universiti 
Paris-XI. 


I. — DESCRIPTION DES MfiTHODES 2 


INTRODUCTION 

Etant donne un tableau & double entree dont chaque ligne correspond 
a un objet (releve, taxon) et chaque colonne a une variable (espece, caractere), 
on cherche a classer les objets en fonction d’afiinites & partir des variables; 
ce tableau constitue la matrice de donnees. 

Geometriquement chaque objet peut se representer par un point d’un 
espace a m dimensions not6 R ra (/n = nombre de variables). 

Pour comparer les objets entre eux, il est necessaire de se donner 
une mesure des ressemblances en fonction des variables, aussi on fait choix 
d’une metrique euclidienne permettant de cafculcr les distances entre les 
points de R m , et en particular entre les diflerents points-objets. De fa$on 
pratique, plus la distance qui separe deux points-objets est courte, plus 
les objets qu’ils representent sont ressemblants. 

L’ANALYSE FACTORIELLE 

Dans R m , 1’ensemble des points-objets forme un nuage presentant 
des directions d’allongement privitegiies; I’analyse factorielle a pour but 
de determiner ces directions. Dans un espace euclidien, la projection ortho- 
gonale d’un segment de droite sur un axe donne est plus courte que le 
segment lui-mSme (fig. 1). 

Done, si on projette le nuage de points-objets sur un axe, on obtient 
une representation unidimensionnelle dont le principal effet est de reduire 
en general les distances entre points-objets projetes. 

De plus, la disposition relative des points-objets projetes nc respectc 
plus les degres de ressemblance des objets qu’ils representent ex. fig. 2., 

En consequence, il faut trouver l’axe de projection deformant le moins 
possible le nuage initial; ce sera celui qui rend maximum le moment d’inertie 
du nuage par rapport a cet axe. 

Ce entire est, h quelques variantes pres, la moyenne des carres des 


1. — Nous sommes reconnaissanls au Profcsseur M. Guinochet d’avoir su stimuler 
au scin de son cquipe Tcmploi de methodes numiriques nous permetiam ainsi de rialiser 
CC lravail. 
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distances entre les points du nuage projete. Pratiquement, plus le nombre 
obtenu sera grand, plus la figure de points projetes se rapprochcra de la 
figure initiale, 

En outre, le moment d’inertie I A par rapport & un axe A est toujours 
inferieur au moment d’inertie total du nuage, I t ot, c’est-i-dire h la moyenne 
des carres dcs distances entre ses points. 

Lc moment d’inertie total Itot est une mesure commode dc l’infor- 
mation contenue dans le tableau de donnees (information au sens general 

et non au sens probabiliste). Le taux d’inertie d’un axe represente 

•tot 

la part d’information exprimie par cct axe. 

L’axe qui rend t a maximum est appele premier axe factoriel et son 
moment d’inertie, premiere valeur propre. 

II est tres rare qu’un ensemble de donnees se ramene 1 une seule dimen¬ 
sion. Le premier axe factoriel ne suffit pas h expliqucr k lui seul les relations 
entre objets, il n’extrait qu’une partie de l’information utile mesuree par t a . 
II est done necessaire d’extraire plus d’information. On peut par exemple 
chercher un 2 C axe de projection orthogonal au premier rendant maximum 
le moment du nuage projete. On calcule ainsi le 2 e axe factoriel qui extrait 
une part d’information plus faible que le premier. 

£tant orthogonaux, les deux premiers axes factoriels extraient chacun 
des informations non correlees. 

On demontre qu’en regie generate on peut extraire une suite d’axes 
factoriels de valeurs propres d&roissantes en nombre £gal i celui des 
variables. 

Les resultats se presentent sous la forme de diagrammes-plans ou 
chaque objet est figure par un point repere par ses coordonnees suivant 
deux axes factoriels. En prenant les axes 1 et 2, on obtient ainsi la meilleure 
representation plane de 1’ensemble des objets. 

L’ANALYSE FACTORIELLE DES CORRESPONDANCES 

Jusqu’ici nous n’avons pas precise de metrique particuliere. L’originalite 
de Panalyse factorielle des correspondanccs reside dans l’emploi de la 
metrique du y. a . 
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Poids de 1’objet N° i : 

*«• = £7=t k, i 
Poids de la variable N° j : 
k.j = £? =1 k tf 

Total dcs Aliments de la matrice : 

=£?-i Z7-i kts 

Carrd dc la distance entre les objets i 
et i' (suivant metrique de x ! ) ■' 


dHW) - k.. YjjL t (kiilki. — Ai'j/Ai'.J* 


Tout d’abord elle ne fait pas intervenir les valeurs brutes k u de la 

kt i 

matrice de donnees mais les profils 

On elimine ainsi dans la comparison des objets entre eux un effet 
de taille. 

Par exemple dans le cas d’un tableau phytosociologiquc k ( , est le nombre 
d’especes du relev^ i. Si un releve i posshde en commun avec d’autres 
releves un meme nombre d’especes, Femploi des profils a pour effet de rap- 
procher i du releve possedant le moins d’especes. 

Pour chaque variable j dans le terme correspondant de la distance 
intervient k, } en denominateur; ceci a pour but d’eliminer un effet de taille 
des variables. 

Par exemple pour un tableau phytosociologiquc oh Arrest la frequence 
absolue de l’espece j dans l’ensemble des releves considers, cette operation 
diminue I’importance d’une espece tres frequente done k ecologie indifferente. 

Pour un tableau taxonomique ou k.j represente la frequence d’un 
caractere qualitatif j au sein de 1’echantillon considere, k.j tres grand 
corresponds done h un caractere peu discriminant. Si j est un caractere 
quantitatif, par exemple la mesure d’un organe, k v represente alors non 
plus une frequence mais un ordre de grandeur de cette mesure dont la 
signification n’est pas interessante en soi. A noter qu’en analyse en compo- 
santes principales, on corrige ces inconvenients en centrant et reduisant 
les variables. 

De plus 1’usage de la metrique du x 2 presentc un avantage majeur : 
la representation simultanee des objets et des variables. On peut remarquer 
que tout ce que nous avons dit au sujet des objets peut s’appliquer aux varia¬ 
bles, L’ensemble des variables peut se reprdsenter par un nuage de points 
d’un espace R” (n 6tant cette fois le nombre d’objets); nuage dont il est 
possible dc recbercher les axes factoriels. Cependant la symetrie est telle 
entre les deux nuages cn usant de la metrique du y} qu’il existe une relation 
matbematique entre les axes factoriels du nuage dc points-objets et 
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ceux du nuage de variables. Plus precisement, k chaque axe factoricl du 
nuage des objets correspond un axe factoriel du nuage des variables de 
meme valeur propre. Grace aux formules de transition qui concretisent 
ces relations, il est possible de representer les objets et les variables sur un 
meme diagramme. Toujours grace 4 ces formules, chaque point-variable 
vient se placer au sein du groupe de points-objets qu’il caracterise le plus. 
Ceci permet une interpretation rapide et sure de la formation de groupes 
ou paquets de points sur chaque diagramme. 

II est possible de chiffrer 1’importance de chaque variable suivant un 
axe par sa contribution absoluc a la valeur propre (la part d’information 
exprim^e par l’axe, dont elle est responsable). 

G*0) = coordonnee de la variable j suivant l’axe k, 
contribution absolue de j a k : 

cak)=^(G k (j)y 

on ddfinit aussi la contribution relative d’une variable j comme le carre 
du cosinus de Tangle fait par le vecteur representant j avec la direction 
de l’axe. Si cette quantite (comprise entre 0 et 1) est proche de la valeur 1, 
on peut dire que la variable j est trfes bien representee par 1’axe eq question. 


L’ARBRE DE LONGUEUR MINIMUM 

Quelques definitions de la theorie desgraphes. Onappelle «graphe» 
un ensemble de points relies par des aretes (cf. fig. 4). 



Un graphe est complet si chaque paire de points est reliee par une 
arete (cf, fig. 5). 

On appelle chemin d’un graphe, une sequence d’aretes contigues. 
Dans le graphe de la figure 4, la sequence d’aretes u x> u 3 , w 4 constitue 
un chemin d’extremites a et c. Un circuit est un chcmin dont les extremites 
coincident, exemple : u 2 , w 4 , w 3 (fig. 4). Un graphe est connexe s’il existe 
un chemin entre deux quelconques de ses points (cf. le graphe de la fig. 4). 
Le graphe de la figure 6 n’est pas connexe. 

Un arbre est un graphe & la fois connexe et sans circuit (fig. 7). 

Enfin un graphe value est un graphe dont chaque arete est affectee 
d’un nombre (positif pour nos applications) mesurant sa longueur. Un 
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exemplc de graphe value est fourni par une carte routiere oil chaque point 
represente une ville et chaque arete une route. 


Application a la classification automatical. Dans l’cspace des 
objets (cf. chapitre precedent) on peut rcprescnter le nuage des points- 
objets par un graphe value complet dont chaque point represente un objet 
et dont chaque arete a pour longueur la distance qui s^pare lcs deux points 

qu’elle relie. Ce graphe comporte — — aretes (« ctant le nombre d’objets). 


Tenter de le dessiner est impossible. Cependant, on peut chercher a le 
simplifier en en retenant sculcmcnt les aretes les plus courtes (celles qui 
relient des objets tres scmblables). Par cxemple, un arbre obtenu k partir 
de ce graphe ne contiendra que n — 1 aretes. De plus cettc figure possede 
la propriete de pouvoir s’etaler sur un plan sans que les aretes se chevauchent. 

Parmi tous les arbres qu’il est possible de construire ainsi, on choisit 
Y arbre de longueur minimum, e’est-a-dire celui dont la sorame des longueurs 
des aretes est minimum. On demontre que ce dernier est en general unique. 
Cet arbre foumit une sorte de squelette du nuage des points objets. 

La construction de t’arbre de longueur minimum confiee k un pro¬ 
gramme se deroule de la fa?on suivante. Partant d’un point quclconque b 
(fig. 8) on relic ce dernier au point c qui en est le plus proche (lc choix 
du point de depart n’importe pas). Ces deux points relies par une arete 
de longueur d(b, c) forment le sous-arbre A. On d^signe par B l’enscmble 



des points non encore relies au sous-arbre A. A chaque etape de l'algo- 
rithme on relie un nouveau point dc B a un point de A de telle fa?on que 
1’arete qui les relie soit la plus courte possible. Progressivement le sous- 
arbre A s’accrolt au detriment de l’ensemble B. La construction s’arrete 
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lorsque B est vide c’est-a-dire quand tous les points sont relies a l’arbre. On 
peut d&montrer que l’arbre ainsi construit est I’arbre de longueur minimum. 

L’arbre de longueur minimum se ramifie en branches plus ou moins 
importantes correspondant k des groupes d’objets homogenes. 11 est toujours 
interessant de comparer Parbre de longueur minimum aux diagrammes 
d’analyse de correspondances, i( permet parfois de reconnaitre un groupe 
d’objets homogenes qui ne se serait individualist qu’en recourant a des 
axes factoriels d’ordre tleve. 

Cepcndant dans le cas d’objets tres proches les uns des autres k dis¬ 
tances relatives sensiblement egales, la condition d’absence de circuit 
entralne k des coupures arbitraires. Ainsi deux objets en realite proches 
peuvent alors se trouver assez eloignes sur Parbre de longueur minimum. 
Cet inconvenient n’existe pas pour Panalyse factorielle des correspondances 
dont les resultats plus nuances sont done plus proches de la realite. 

Comme la plupart des techniques dc classification automatique Parbre 
de longueur minimum peut s’appliquer avec n’importe quel type de distance, 
en particular avec Pindice de Jaccard quand il s’agit de donnees phyto- 
sociologiques. 


n. EXEMPLE DUPLICATION EN TAXONOMIE : 

LE GENRE SAW AGES!A L. (OCHNACEAE)' 

L’analyse factorielle des correspondances a dtja ete utiliste en systema- 
tique pour des problemes se situant a des niveaux specifiques ou subspeci- 
fiques (Blaise, 1969; Bruner ye et all., 1969; Cartier, 1972; Gardou, 1972). 

II nous a semble interessant de traiter ici d’un probleme situe au niveau 
genttique, par exemple le genre Sauvagesia L. 

Jusqu’a present la systematique de ce genre etait consideree comme 
tres complexe, les relations entre les taxa infrageneriques souvent mal 
comprises. Dc plus, d’autres genres tres proches a limites systematiques 
imprtcises ont etc decrits : Lavradia , Neckia , PentaspateUa, Leitgebia , 
Roraimanthus et Vausagesia. Nous avons traite les especes, sous-especes et 
varietes, soit 35 Unites taxonomiques operationnelles (U.T.O.) en les consi- 
derant comme faisant partie d’un ensemble taxonomique. 

Pour la majorite des U.T.O., les observations portent sur 50-150 speci¬ 
mens d’herbier. Malheureusement, pour certaines d’entre elles, nous avons 
du nous contenter d’un nombre plus restreint de specimens (moins de 10). 

26 caracteres distinctifs soit quantitatifs, soit qualitatifs, subdivisds 
en 80 etats ont ete utilises. Les caracteres quantitatifs ont ete subdivises 
en classes contrairemcnt k ce qui a ete fait dans certains travaux antcricurs 
(Blaise, 1969; Gardou, 1972). 

Les U.T.O. ont 6t6 cod6es par ordre alphabetique d’especes de l a 35 
et les etats de caracteres de 1 a 80. La liste des U.T.O. et des caracteres a ete 
publiee dans un travail anterieur 1 2 (Sastre, 1971). 

1. — Par C. Sastre. 

2. — Sauf pour S. paucielata Sastre (U.T.O. 35), espece decrite ulterieurement. 
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Les problemes relatifs au choix des caracteres ont ete abordes dans 
ce meme travail, aussi je me bornerai a resumer les raisons pour lesquelles, 
certains caracteres n’ont pas ete utilises : ils sont redondants, ils n’ont pas 
ete observes chez toutcs les U.T.O., ils sont trop variables chezune ouplu- 
sieurs U.T.O., ils sont lies k d’autres caracteres. 


INTERPRETATION DE L’« ARBRE DE LONGUEUR MINIMUM » 

Les U.T.O. se r^partissent en 7 groupes (fig. 9). 

11 est int6ressant de noter que la majority des U.T.O. se trouve distri¬ 
bute sur 1’arbre en fonction do leur adaptation morphologique et anatomique 



a la secheresse. Les U.T.O. les moins bien adaptees sont en majorite situees 
sur l’axe de 1’arbre k l’exception de la partie gauche (avec 25, 13 et 10), 
tandis quc les especes bien adaptees se repartissent k la peripherie de l’arbrc. 

L'avantage de cette methode est sa rapidite. L’« arbre minimum » 
prend principalement en consideration les distances taxonomiques les plus 
faibles, or, il peut etre interessant de connaitrc les distances moyennespour 
Studier d’une fagon plus precise les rapports entre les sous-groupes. 

Utilisee complemcntairement, l’analyse factorielle des correspondances 
permet de pallier a cet inconvenient et de pr^ciser les rapports entre les 
sous-groupes et queiquefois entre les sous-sous-groupes. 


INTERPRETATION DES DIAGRAMMES D’analyse de correspondance 

Recherchons sur le plan 1-2 (fig. 12), les groupes d6finis apres examen 
de l’« arbre de longueur minimum ». 

35, 6, 7, 30 se trouvent groupees avec 32 et 33; par contre dans le 
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plan 1-3 (fig. 10), ces deux ensembles d’U.T.O. sont separes. Cette remarque 
permet de nous suggerer une relative independance de ccs deux ensembles. 



Fig. 10. — Diagramme d’analyse des correspondences des U.T.O., axes 1 et 3. 

La disposition des U.T.O. dans le sous-nuage comprenant 35, 6, 7, 30 
peut nous laisser sous-entendre le sens evolutif de ce groupe. L’U.T.O. 30 
(genre monospecifique Neckia), paraissant la plus primitive est situee pres 
du point d’origine tandis que l’U.T.O. 35, plus evoluee est dans la partie 
peripherique du nuage. 

15, 18, 34, 4, 12, 8 et 1 (genres Lavradia ct Vausagesia) se retrouvent 
toujours dans le meme sous-nuage quelque soit les axes consideres. La 
position des U.T.O. 1 et 34 montre leur importance comme elements 
intermediaires entre le groupe central et les autres U.T.O. incluses dans 
ce sous-nuage. La disposition des especes nous suggere le sens evolutif 
de ce sous-groupe avec les U.T.O. 8 et 12 comme fin de phylum. Dans 
cet ensemble taxonomique, 8 et 12 semblcnt effectivement les U.T.O. les 
plus dvoluees pour de nombreux caracteres (diminution de la taille des feuilles 
et de Timportance de l’appareil vasculaire foliaire, passage de la placentation 
parietale vers la placentation basale). 

5, 31, 20, 19, 26, 17, 16 et 23. Ce groupe forme un sous-nuage, mais 
dans les plans 1-3 ct 2-3, il existe deux sous-ensembles 4 direction parallcie, 
un premier sous-groupc compose dc 5, 31, 20, 19 et 26 part toujours du 
point d’origine avec 5 et 31 tandis que 26 est toujours & la Peripherie, 
un deuxi&me sous-groupe compost de 23, 17 et 16 avec cette dernicre 
U.T.O. en peripherie. 

Dans les differents plans, la distance entre 16 et 26 est constante, 

L’etude detaillee de ces deux especes montre qu’elles sont arrivdes 
approximativement au meme stade evolutif et qu’elles appartiennent a 
deux phylums differents. Elies vivent toutes les deux dans des conditions 
ecologiques identiques. Elies doivent rcsister 4 des variations climatiques 
brusques : insolation, vent, dessiccation. Toutes les deux possedent une 
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Fig. 11. — Diagramme d'anaiyse des correspcmdances des 4iat$ de caraciere, axes 1 el 2. 

cuticule cpaisse, des elements lignifies importants, et, de plus, les fleurs 
sont depourvues de staminodes externes, leurs staminodes internes sont 
reduits et leur placentation est basale. 

II est possible de faire une remarque identique avec les U.T.O. 17 
(genre Roraimanthus ) et 23 qui se retrouvent toujours ensemble; elles 
appartiennent it des phylums differents et sont adaptees & des condi- 
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tions ecologiques de savane avec brusques variations climatologiques. 

22, 2, 24 avec 21, 29, 27, 3, 11, 9 et 14 forment un groupe central 
d’U.T.O. raontrant beaucoup de ressemblances entre elles. 


f* 



Fig. 12. — Diagramme d’analyse des correspondances de$ U.T.O., axes 1 et 2. 

25, 13 et 10 ont toujours h peu pres la merae distance taxonomique 
quelque soitle plan considere. 25 et 13 sont tres prochcs Tune de Fautre 
particulierement dans le plan 1-3 et se disposent en peripherie. Ces rappro¬ 
chements sont phylogenetiquement artificiels. 25 et 13 semblent etre deux fins 
de phylum arrives a un niveau 6volutif a peu pres equivalent. 


RELATIONS U.T.O. — ETATS DE CARACTERE 

L’examen compare des diagrammes d’analyse factorielle des U.T.O. 
et des etats de caractere permet d’etablir facilement les rapports existant 
entre les U.T.O. et ces derniers. Pour aider au raisonnement, les lignes 
et les colonnes de la matrice des donnees ont ete ordonnees en tenant 
compte des groupements suggeres par les diagrammes d’analyse factorielle 
des axes 1 et 2 (fig. 12 et 11). Cette matrice remaniee sera appelee : tableau 
des relations U.T.O.-etats de caractere. 

Dans les deux diagrammes (axes 1-2 des U.T.O. et des etats de carac¬ 
tere), le nuage obtenu adopte grossierement la forme d'une dtoile a trois 
branches : 

— une situde dans le quadrant superieur droit du diagramme (bran- 
che 1), 
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— une situee dans le quadrant inferieur droit du diagramme (bran- 
che 2), 

une situee dans le quadrant superieur gauche du diagramme (bran- 

che 3). 
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Examen de la branche 1 

Dans la partie la plus peripherique, nous trouvons I’U.T.O. 16 et 
les etats 61, 41 et 79. 

Sur Je tableau des relations U.T.O.-etats, nous voyons que 61 n’existe 
que chez 16,41 chez 16 et 26, 79 chez 16 et 17. Autrement dit ces trois etats 
ne se retrouvent que chez les U.T.O. les plus peripheriques et en consequence 
sont bien caracteristiques de ces U.T.O. 

Les etats suivants (situes plus pres du centre) 4, 60, 26, 85, 67... exis¬ 
tent au moins chez l’une de ces trois U.T.O, mais aussi dans d’autres appar- 
tenant a des sous-nuages difRrents (4 Pexception de 60 qui ne se trouve 
que chez 26). 

Ces premieres remarques sont taxonomiquement importantes. 16 est 
l’espece-type du genre monospecifique Leitgebia qui ne possederait comme 
caractere distinctif que celui de l’etat 61, c’est-4-dire : epaisseur de la cuticule 
superieure du limbe = 7,5-9 ft. Est-il possible de pouvoir distinguer un 
genre d’un autre en se basant sur ce seul critere ? 

Pour Oliver (1877) ce genre devait etre constitut par les U.T.O. 16 
et 17. Le seul etat se trouvant uniquement dans ce « genre » est le 79 ; 
plus de 8 hies ccllulaires dans le massif inferieur de fibres. 

Gleason (1931) decrivit le genre monospecifique Pentaspatella 4 partir 
de l’U,T.O. 26. Ce « genre » ne se distinguerait du genre Sauvagesia uni¬ 
quement par l’ttat 60 ; epaisseur de la cuticule superieure du limbe = 
6-6,5 g. 

Les genres Leitgebia et Pentaspatella avaient ete etablis principalement 
a cause de la structure florale : placentation basale (41); absence de stami- 
nodes extemes (32) et staminodes internes reduits (35), 

Effectivemcnt 41 n’existe que chez 16 et 26, par contre de nombreuscs 
especes de Sauvagesia possedent les etats de caractere 32 ou 35 et parfois 
32 et 35, ex. U.T.O. 11. Pour ces raisons, il ne nous semble pas possible 
de maintenir ces genres. 

Examen de la branche 2 

Nous trouvons les U.T.O. 8, 12, 4, 15, 18, 34 et 1, c’est-a-dire les 
genres Lavradia et Vausagesia\ aucun etat ne caracterise l’un d’eux. Lavradia 
avait ete defini grace 4 l’etat 64 : staminodes internes soudes, or, ce caractere 
se retrouve toujours chez 30 (genre monospecifique Neckia ) et souvent 
chez 1 (genre monospecifique Vausagesia). 

Examen de la branche 3 

Elle est moins bien definie at est constitute principalement par les 
U.T.O. 7, 35, 32, 6 et 30 avec 22, 27 et 21. Aucun etat de caractere n’est 
sptcifique de cc groupe d’U.T.O. 

La distribution des etats dans ce tableau ne laisse apparaitre aucun 
groupe d’entre eux susceptible de caracteriser specifiquement une ou plu- 
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sieurs U.T.O. Ceci nous laisse suggerer que l’ensemble taxonomique est 
homogene et que toutes les U.T.O. doivent etre regroupees dans un genre 
unique, soit le genre Sauvagesia. 

Les methodes numeriques utilisees calculent les distances taxonomiques 
cxistant entre les differentcs U.T.O, Les rapprochements obtenus peuvent 
avoir deux origines principales : les especes sont effectivement affines, 
les cspeces malgre qu’elles appartiennent a des phylums differents montrent 
beaucoup de ressemblances, celles-ci pouvant etre dues, par exemple b des 
convergences de forme. C’est au taxonomiste qu’il appartient de faire la 
distinction lui permettant ainsi de pouvoir tirer des conclusions evolutives 
(Sastre, 1971). 


HI. — UN EXEMPLE DUPLICATION A LA PHYTOSOCIOLOG1E : 

LE PROBI.EME DU FESTVCETVM HALLERI 
DU BASSIN SUPERIEUR DE LA TINEE (ALPES-MAR1T1MES) 1 

L’exemple utilise nous sera fourni par le travail execute sur le terrain 
par Tun d’entre nous dans les zones de contact entre substrats calcaires 
et siliceux, substrats sur lesquels se differencient deux sous-associations 
du Festucetum halleri B.B. ; la sous-association a Festuca ovina subsp, 
laevis var. scardica sur silice, la sous-association i Carex sempermrens 
sur calcaire (M. Guinochet, 1938). Les resultats de cette etude suggeree 
par le Professeur Guinochet a la lumiere de precedents resultats (M. Guino¬ 
chet, 1973, p. 51 et 98) ont fait I’objet d’un memoire dans lequel I’analyse 
des donnees ccologiques complete et confirme l’analyse des donnees floris- 
tiques resumee ici (J.-J, Lazare, 1972). 


unites opErationnelles et caractEres 

La methode phytosociologique utilisee est la methode de I’Ecole zuri- 
cho-montpellieraine (J, Braun-Blanquet, 1928, 1969). En chaque station 
choisie, I’observateur recense la totalite des especes vegetales presentes 
ou bicn, commc c’est le cas dans notre exemple, les seules Phanerogames 
et Cryptogames vasculaires, en affectant chaque taxon (nous utiliserons par 
la suite indifKremment espece ou taxon, 6tant bien entendu que les infra- 
specifiques peuvent faire l’objet de recensement separe) d’un coefficient 
d’abondance. A partir de la liste floristique de l’ensemble des stations 
on constitue un tableau brut de donnees dont chaque ligne correspond h unc 
espece et chaque colonne a un releve. Nous ne reviendrons pas ici sur les 
raisons qui nous conduisent a ne tenir compte dans les analyses que de la 
seule presence ou absence des espcces et non de leurs coefficients d’abon¬ 
dance (G. & M. Roux, 1967; L. Orloci, 1968; M. Guinochet, 1968). 
Le tableau brut se presente done sous la forme d’une matrice logique (e'est- 

I. — Par J.-J. Lazare et G. Roux. 


Source: MMHN, Paris 


— 125 


&-dire dont lcs elements sont des 0 — absence — ou des 1 — presence — 
qui, signalons-le des k present, comporte bien plus de 0 que de 1, La forme 
des donnees se revele done assez identique k celle de Fexemple precedent 
puisque dans les deux cas, les donnees sont ramendes k une matrice logique. 


ANALYSE FACTOR1ELLE DES CORRESPONDANCES 
A. « ANTI-ESPECE » ET « ANTI-RELEV^ » 

Si une telle matrice scmble se preter particulicremcnt & l’analyse statis- 
tique de par son exhaustivite (pas de donnees manquantes) et son homo- 
geneite. elle presente toutefois un tel « vide » (80 % de 0 dans notre exem- 
ple) que nous pourrions craindre un certain desequilibre. II est possible 
de compenser ce vide de deux manieres : 

- soit creer pour chaque releve une sorte d’« anti-releve » constitue 
des especes absentes du relevd consid^re, ce qui revient it associer It chaque 
colonne une colonne complementaire, 

~ soit associer a chaque espece une « anti-espece » presente dans 
tous les releves ou I’espece consideree est absente, ce qui adjoint k chaque 
ligne une ligne complementaire. 

Quels cn seront lcs effets rcspectifs : dans lc premier cas, la duplication 
conduit a donner le meme poids aux especes, dans le second cas elle donne 
lc meme poids aux releves. Deux remarques s’imposent : d’une part l’hite- 
rogeneite de poids des especes et celle des releves ne sont pas du meme ordre 
de grandeur (pour le cas envisage, les releves possedent de 14 a 41 especes 
tandis que les especes apparaissent dans 1 a 36 releves) d’autre part « anti- 
espece » et « anti-releve » n’ont pas la meme signification; cn effet si 
l’« anti-espece » represente la possibilite d’une espece hypothetique de vivre 
en tous lieux etudies sauf celui de Fespece initiate (possibilite non negli- 
geable dans un territoire homogenc comme e’est le cas ici), F« anti-releve » 
represente une aberration complete de la nature puisqu’il comporterait 
un no mb re d’cspece excessif et que la probabilite de reunir exhaustivement 
ces especes est pour ainsi dire nulle, 

Faut-il intervenir sur les poids? En fait poids des lignes et poids des 
eolonnes ont des significations differentes. Unc colonne est une entite 
constante puisqu’il s’agit d’un releve dont le nombre d’especes est bien 
defini. Une ligne, par contrc, est le resultat d’une agglomeration momen- 
tance d’un certain nombre de releves quel’on pourraitaugmenter ou dimi- 
nucr k loisir, II ne parait done pas souhaitable de vouloir a priori trans¬ 
former les releves pour leur donner le meme poids car ce poids a sans aucun 
doute une signification. II semble par contre concevablc de compenser 
la grande variabilite du nombre de releves ou se trouve representee une 
espece par une duplication des eolonnes. 

Voyons k present les resultats de ces operations sur 1’exemple que nous 
avons choisi. 
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Fig. 13. Carte dcs relevis 4 partir des demnies brutes; plan des axes t et 2 (seals les numfiros 
des rcleves piriphiriques ont precises. Jes autres relevis itant figures par un point noir 
pour rend re compte de leur dispersion). 



Fig. 14. — Carte des releves i partir des donnGcs brutes; plan des axes 2 et 3. 
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B. Gen£ralit£s sur les donn£es utilisees 

Les differentes analyses ont etc operecs sur un tableau brut comportant 
101 espdces pour 43 releves. La numerotation de 2 k 45 provient du fait 
que nous n’avons pas utilise les releves 1 et 3 etrangers au Festucetum 
halleri. Nous insisterons sur la difficulty de circonscrire des nuages de points 
bien individualises qui pourrait conduire a appuyer la theorie du « conti¬ 
nuum »(R.-P. Me Intosh, 1967). Cet effet est du & l’<5chantillonnage delibere 
de la plupart de nos stations dans des zones de contact geologique ou les 
apports colluviaux sont importants. Les coupures se reveleraient plus aisees 

a p* 


Ab 



Tta 

Fig. 15. — Carte des especes & partir dcs donnees brutes; plan des axes I et 2 (settles les abr6- 
viations des noms dcs especes p6riphirtques ont^ti pr£cisies, les autres especes 6tant figu¬ 
res par un triangle noir). 
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lors d'analyses de groupements varies d’un territoire donne, coupant ainsi 
court a une telle interpretation (G. Roux, 1967, 1971; J. Ritter, 1969; 
A. Lacoste, 1971, 1972; J.-C. Klein, 1972; M. Guinochet, 1973...). 

C. Analyse des donn£es brutes 

La premiere analyse ex£cut£e donne de bons elements de reflexion. 
Des les axes 1 et 2 (fig. 13) quatre directions se manifestent, materialises 
a leurs extremites par les releves les plus typiques, soient, compte tenu du 
graphe des especes : 

— 17, 23, 28 : tendance au Seslerion (Festucetum halleri sous-ass. 
a Carex sempervirerts p.p.). 
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Fig. 16. — Carte des especes it partir des donn6es brutes; plan des axes 2 et 3. 
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— 2,4,5,6,7, 34 : tendance au Festuceto-Trifolietum thalii (Festucetum 
halleri sous-ass. a Carex sempervirens p.p.), 

— 44, 45 : Festucetum halleri sous-association &. Festuca ovina ssp. 
hevis var. scardica, 

— 13, 21, 22, 36, 38, 39 : tendance au Nardion. 

Le reste se trouve tres centre autour de 1’origine ce qui conduit a recou- 
rir pour la discrimination a deux methodes : soit observer les distinctions 
selon les axes 3,4 et 5, soit recourir & des analyses partielles sur les donnees, 
reduites des releves peripheriques (G. Roux, 1971; G. & M. Roux, 1971; 
C. Desarmenien, 1971; A. Lacoste, 1971, 1972). Nous nous limiterons 
aux axes 2 et 3 (fig. 14) selon lesquels on isole facilement les releves 13, 21, 
22, 39 alors que les releves 36 et 38 ont tendance a rejoindre le groupe 2,4, 
5... La comparaison avec les nuages especes (fig. 15 et 16) permet d’une 
part de rattacher les difKrents ensembles a des groupements connus, d’autre 
part k interpreter les axes successifs d’allongement du nuage. Alors que les 
releves 13, 21, 22, 39 peuvent etre interpretes comme un facies chionqphile 
du Festucetum halleri avec de nombreuses especes du Nardion , les releves 
mal isoles correspondent a un groupement de transition entre les deux sous- 
associations etudiees. Compte tenu d’analyses parallcles sur des donnees 
ecologiqucs selon la methode precedemment decrite par A. Lacoste & 
M. Roux (1972), les axes peuvent etre interpretes ainsi : axe 1 = aciditc 
croissante, axe 2 = secheresse et nitrqphilie (correlees ici compte tenu du 
mode de paturage), axe 3 = durde d’enneigement d6croissante. II est a 
noter deux phenomenes : d’une part la grande contribution d’especes de 
basses frequences (presentes dans 1 ou 2 releves), d’autre part la conden¬ 
sation de la plupart des releves autour de l’origine, ce qui conduit a une 
discrimination difficile. 

D. Analyse des donnees apr£s duplication des releves 

On remarque que sur le premier axe (fig. 17), le classement des especes 
s’opire selon les frequences croissantes. Parallelement tous les releves s’oppo- 
sent fondamentalcmcnt au groupe des « anti releves », ce qui se concevait 
de par l’anomalie qu’ils representent. En consequence aucunc discrimination 
sur les criteres de composition floristique ne peut se faire selon cet axe, 
ce qui conduit a n’utiliser pour la reconnaissance d’ensemblcs que les axes 
ulterieurs en particular les axes 2 et 3 (fig. 18). Deux remarques s’imposent 
a l’observation du graphe des releves selon ces axes ; I’eclatcment du nuage 
central du a la condensation des « anti-releves » autour de l’origine et la 
grande analogic avec l’analyse pr6c6dente puisque, mise a part la symetrie 
des graphes, les ensembles degages sont a peu pres identiques. Le graphe 
espece, lui, s’avere particulierement interessant (fig. 19) ; les contributions 
les plus fortes se rapportent a des especes de moyennes frequences (6 & 36), 
ce qui exclut la discrimination de releves sur la base d’esp&ces exceptionnelles 
(qu’elles soitnt des caracteristiques rares d’association ou des « acciden- 
tcllcs »), La resultante est la reconnaissance de grands ensembles de stations 
au detriment des tres petits groupes qui s’isolent rarement. On peut prati- 
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Fig. 17. — Carte des releves apres leur duplication; plan des axes 1 et 2 {les « anti-relevis a ont 
6t6 figures par un cercle blanc; les traces en pointilli circonscrivent les points correspondant 
aux cspcces de classes de frequence donnies). 



Fig. 18. — Carte des releves apres leur duplication; plan des axes 2 et 3 (les « anti-relevis » 
n’ont pas ete figures). 
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quement schematiser ces ensembles en les reduisant aux 4 quadrants, 
le second axe separant les especes des Caricetea curvulx a gauche, des 
especes des Elyno-Seslerielea a droite dans leur plus grande majorite. 
Sur le diagramme esp&ce, les especes peripheriques correspondent k des 
caracteristiques ou des compagnes de haute frequence pour les groupes 
mis en evidence : 

— Axe 2 negatif, axe 3 positif = Festucetum halleri sous-association 
a Festuca avec notamment Juncus trifidus, Sempervivum arachnoideum, 
Festuca halleri , Euphrasia minima... 

— Axe 2 negatif, axe 3 negatif = tendance au Nardion avec Nardus 
stricta, Ranunculus montanus et it. pyrenxus, Poa alpina , Geum montanum , 
Viola calcarata... 

,r? 
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Fig. 19. — Carte des especes apris duplication des relevis; plan des axes 2 et 3. 
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— Axe 2 positif, axe 3 negatif — tendance au Fesluceto-Trifolielum 
thalii avec Festuca violacea, Trifolium thalii. Trifolium pratense... 

— Axe 2 positif, axe 3 positif = tendance au Seslerion avec, en parti¬ 
cular, Helianthemum nummularium, Anthyllis vulneraria, Gentiana verm. 
Aster alpinus , Elyna myosuroides... 

L’interpretation des premiers axes s’avere identique k celle de l’autre 
analyse, mis k part le dScalage de numerotation des axes utilises. 

E. Analyse des donn^es apr£s duplication des especes 

Si nous observons d’abord le nuage espece selon les deux premiers 
axes (fig. 20), nous constatons la non-distinction tranche especes « anti- 
especes » mais d’une maniere generate une plus grande dispersion des especes 



Fig. 20. — Carte des esptces apres duplication de celles-ci; plan des axes 1 et 2 (les « anli- 
espcces » ont it6 figurccs par un triangle noir). 
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que des « anti-especes », condensees autour de 1’origine. En ce qui concerne 
le nuage releve (fig. 21), si la disposition est k peu pres conforme a celle 
dc la premiere analyse, il y a par contre accentuation de deux directions 
aux depens des deux autres : Tune vers les releves 17, 23, 28, l’autre vers 
les releves 2, 4, 5, 6, 7, 34. Les plus grands changements se manifestent 
au niveau des releves a grand nombre d’especes comme le 34 (41 especes), 
le 32 (40), le 4 (36), etc. 



Fig. 21. — Carte des relevis apris duplication des especes; plan des axes 1 et 2. 

Pour le role des especes, il faut remarquer une analogie frappante avec 
la premiere analyse ou les especes de faible frequence interviennent de 
maniere importantc, d’oii les memes exagerations de distances pour ces 



Fig. 22. — Carte des relevis apres duplication des especes; plan des axes 2 et 3. 
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releves presentant des especes rares sinon exclusives et le meme tassement 
des autres releves. Selon le 3* axe (fig. 22), le groupe 13, 21, 22, 39 s’indivi¬ 
dualise comme sur la figure 14. 

F. Conclusion sur l’analyse des correspondances 

Nous devons faire remarquer quc lcs rcsultats obtenus dans les trois cas 
sont tres similaires, ce qui concretise la signification plus grande de la pre¬ 
sence d’une espece par rapport a son absence (G. Roux, 1971; C. Desar- 
m£nien, 1972) et qui revcle que I’on peut se satisfaire largement, en phyto- 
sociologie, de 1’analyse des donnees brutes. Ccpcndant, il semble utile 
dans la mesure du possible, tout au moins dans le cas d’etudes de groupc- 
ments floristiquement voisins, de faire prec^der une telle analyse par une 
duplication des releves pour degager au maximum les grandes orientations 
du nuage en fonction des especes de moyenne frequence. L’analyse des 
donnSes brutes permettra alors de reconnaitre eventuellcmcnt des groupes 
de peu de releves qui, le plus souvent, nuisent a une vision synthetique. 


ARBRE DE LONGUEUR MINIMUM 

Nous nous limiterons ici & quelques remarques sur le trac£ obtenu (fig. 
23). Nous retrouvons en fin de branches les releves les mieux isolespar 1’ analyse 
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des correspondances : (2, 4, 5, 6, 7, 34, 36, 38, 39) (17, 23, 28, 29) (21, 22), 
(41,44,45) mais, d’une part, leurs intercorrelations ne sont pas evidentes, 
d’autre part, les autres releves sont lies de fagon tres arbitraire. II est Evident 
que nous nous trouvons dans le cas oil la methode est particulierement 
inadaptee au type de donnees. En effet, les releves utilises ont une compo¬ 
sition floristique tres voisine ct par suite, des distances au sens mathematique 
tres proches, ce qui conduit pour obtenir une liaison unique entre releves 
a trancher presque arbitrairement entre deux distances presquc egales. 
La methode s’opposant par definition a toute boucle s’avere ici particuliere¬ 
ment genante, ce qui etait bien loin d’etre le cas dans les travaux phyto- 
sociologiques precedents (G. & M. Roux, 1971; A. Lacoste, 1972; J.-C. 
Klein, 1973; C. Desarmenien, 1971). 


LfejENDE DES GRAPHES REPRESENTANT LES ESPECES 


Abre- 

VIATIONS 

Espfccrs 

AbrL- 

VIATIONS 

ESPfeCES 

Am 

Achillea millefolium 

He 

Hippocrepis comosa 

Aa 

Agrosns alpina 

Ha 

Homogyne alpina 

Ar 

Agrostis rupestris 

Jt 

Juncus trifid us 

Ala 

Alchemilla alpina 

Jn 

Juniperus nana 

Af 

Alchemilla flabellata 

Lp 

Lcontodon pyrenaicus 

Alg 

Alopccurus gerardi 

LI 

Luzula lutea 

Ac 

Androsace carnea 

Ls 

Luzula spicata 

Ao 

Anthoxantum odoratum 

Ms 

Minuartia sedoidcs 

Av 

Anthyllis vulneraria 

Mv 

Minuartia verna 

Arc 

Arenaria ciliata 

Ns 

Nardus stricta 

Arm 

Arnica montana 

Nn 

Nigritella nigra 

Asa 

Aster alpinus 

Pk 

Pedicularis kerneri 

Ab 

Aster bellidiastrum 

Pr 

Pedicularis rosea 

Ag 

Astragalus gaudini 

Pt 

Pedicularis tuberosa 

Avv 

Avena versicolor 

Pp 

Phyteuma pedemontanum 

Bl 

Biscutella laevigata 

Ps 

Plantago serpentina 

Cr 

Cardamine resedifolia 

Poa 

Poa alpina 

Csp 

Carduus sp. 

Pa 

Polygala alpcstris 

Cc 

Carex curvula 

Pv 

Polygonum viviparum 

Ch 

Chrysanthemum coronopifolium 

Pc 

Potentilla crantzii 

Df 

Dcschampsia flexuosa 

Pg 

Potentilla grandifiora 

Dn 

Dianthus neglectus 

Puv 

Pulsatilla vernalis 

Da 

Draba aizoides 

Rm 

Ranunculus montanus 

Dc 

Draba carinthiaca 

Rp 

Ranunculus pyrenteus 

Do 

Dryas octopetala 

Ra 

Rumex acetosella 

Elm 

Elyna myosuroides 

Sh 

Salix hcrbacea 

Eu 

Erigeron uniflorus 

Sm 

Saxifraga moschata 

Ea 

Euphrasia alpina 

Sal 

Sedum alpcstre 

Em 

Euphrasia minima 

Ss 

Selaginella spinulosa 

Fh 

Fcstuca halleri 

Sa 

Sempervivum arachnoideum 

Fv 

Fcstuca violacca 

Sem 

Sempervivum montanum 

Gb 

Gentiana bavarica 

Si 

Senecio incanus 

Gv 

Gentiana verna 

Se 

Silenc cxscapa 

Gm 

Geum montanum 

So 

Soldanella alpina 

Gn 

Globularia nana 

Stm 

Statice montana 

Hn 

Helianthemum nummularium 

Taa 

Taraxacum alpinum 
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Abr6- 


Abr(- 


VIATIONS 


Especes 


VIATIONS 


Esepces 


Tha Thalictrum alpinum 
Ta Thesium alpinum 

Ts Thymus serpyllum 

Tal Trifolium alpinum 

Tp Trifolium pratense 


Tt Trifolium thalii 


Vu Vaccinium uliginosum 

Vb Veronica bcllidioides 

Vs Veronica serpyllifolia 

Vc Viola calcarata 


CONCLUSIONS 


Nous esperons avoir montre le parti qu’il cst possible de tirer de l’emploi 
judicieux des methodes modernes d'analyse de donnees. Cependant, celles-ci 
ont des limites et elks ne sauraient remplacer le long et ardu travail du 
specialiste. En effet, il convient d’apporter un soin particulier k l’etude 
preliminaire du probleme et de definir les buts 4 atteindre. Ce n’est qu’apres 
cette premiere etape que le chercheur commencera la collecte des donnees. 
II est souhaitable que celle-ci s’effectue en collaboration avec un statis- 
ticien qui, en fonction des problemes poses, conseillera une methodologie 
adequate et aidera a etablir un codage efficace. 

La pratique de ^utilisation des methodes modernes d'analyse des 
donnees nous incitent a quelques remarques : 

— la classification automatique, en particulier l'arbre de longueur 
minimum doit etre appliquee avec precaution au traitement de donnees 
biologiques. L’analyse factorielle des correspondances nous enseigne que 
ce type de donnees se resume plus en gradations qu’en classes bien 
distinctes, 

— en revanche, la classification automatique par sa simplification et 
sa schematisation des donnees peut aider k etablir des coupures qui pourront 
eventuellement servir de base au phytosociologue et au systematicien. 
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